2.4 AI 및 LLM(거대 언어 모델) 도입으로 인한 테스트 패러다임의 붕괴
- 2.4 AI 및 LLM(거대 언어 모델) 도입으로 인한 테스트 패러다임의 붕괴
- 2.4.1 결정론적(Deterministic) 출력에서 확률적(Stochastic) 출력으로의 전환
- 2.4.2 ’정답’의 정의 모호성: 창의적 생성물에 대한 참/거짓 판별의 어려움
- 2.4.3 환각(Hallucination) 현상과 사실 관계 검증의 복잡성
- 2.4.4 자연어 처리에서의 의미적 동등성(Semantic Equivalence) vs 문자적 일치(Exact Match)
- 2.4.5 프롬프트 민감도에 따른 결과의 비일관성(Inconsistency) 문제
- 2.4.6 블랙박스(Black-box)로서의 AI 모델과 설명 불가능성(Explainability)이 오라클에 미치는 영향